GPU集群扩展:Ray Serve与Celery的技术选型与应用场景分析 Celery是分布式任务队列,把任务推到broker,worker拉取执行。它的核心是扇出扇入(fan-out/fan-in),特别适合大批量离线处理。Ray Serve是模型服务平台,基于Ray集群,专门为低延迟、高并发的在线推理设计,天生支持GPU资源调度 gpu 集群 ray rayserve celery 2025-09-05 20:29 2